Supervisión densa y actualizaciones dispersas en OPD
Analizamos la estructura de actualizaciones en OPD: son pequeñas, dispersas y aprovechan subredes, revelando claves para optimización post-training.
Analizamos la estructura de actualizaciones en OPD: son pequeñas, dispersas y aprovechan subredes, revelando claves para optimización post-training.
La capa PC estabiliza el espectro de valores singulares en LLMs, mejorando convergencia sin overhead de inferencia. Optimiza tu pre-entrenamiento.
Descubre cómo la equivarianza exacta entrenada permite generalización zero-shot a través de grupos de simetría, reduciendo errores y mejorando la eficiencia en modelos de IA.